按硬件选型

在选型原则中直接获取硬件最优选择,同时避免黑名单中硬件。

硬件选型实践

  • CPU选型:

    • 对于CPU主要需要注意指令集,在云平台不同指令集下可能导致云主机热迁移失败,因此针对不同型号的CPU建议分集群,将不同的CPU放置在不同的集群。
    • 同时面对不同场景需采购不同特性的CPU,针对高性能业务场景需采用高主频CPU,常规业务时可选择常见的CPU型号。
    • 目前市面CPU常见频率为1.86GHz、2.2GHZ、2.3GHz,CPU核数常见为40、48、64等核数,线程常见为96、128、144、160等线程数。
    • 如果针对采用ZStack企业分布式存储且为存储节点与计算节点分离的场景中,在CPU选型上推荐:双路Intel Xeon Silver 4114 及性能更加强大的CPU。
    • 若采用ZStack企业分布式存储超融合场景,因需要考虑每个OSD 1个CPU内核线程的损耗,所以需要在常规CPU中考虑企业存储所占用的CPU资源,针对ZStack Cloud云平台的CPU超分建议1-4倍,同时建议在云主机CPU性能要求高的场景可开启host-passthrough提供和硬件CPU相同的处理能力。
  • 内存选型:

    • 内存选型需根据实际业务虚拟机规格进行计算,
      • 例如4c8G规格大小的虚拟机数量内存总和即为所需要的物理内存之和。
      • 在单台物理机上云主机数量,常规为单台物理机上运行10台云主机。
    • 目前市面中常见云主机常规规格为4C4G、4C8G等配置进行计算和规划,如果有其他规格可根据实际进行计算。
    • 同时在内存容量规划上还需要进行系统层面的保留。
      • 例如针对操作系统保留10G内存,防止发生OOM导致系统异常。
      • 针对ZStack Cloud云平台管理节点程序内存保留15G。
      • 针对采用ZStack企业分布式存储超融合架构,单个OSD需保留5G内存,即OSD*5=保留容量。
      • 目前ZStack Cloud云平台中常见对于内存常见单台物理机内存容量为128G-256、256G-521G区间内。
      • 针对ZStack Cloud云平台上的配置,可根据业务本身对内存要求较高可适当开启大页内存。
  • 硬盘选型:

    • 在ZStack Cloud云平台最佳实践中,任何存储方式中系统盘均推荐使用SSD,因SSD能够提供较高的IOPS和带宽,且管理节点均采用数据库以及各软件进行提供服务,因此选择性能更好的SSD用以提供更好的使用体验。
    • 针对使用ZStack企业分布式存储中SSD和HDD针对不同方案进行分别配比,生产环境比例为1:5即1块SSD对应5块HDD,机械硬盘选购时需考虑尺寸和容量,同时需关注硬件的IOPS和带宽。
    • 在ZStack企业分布式存储中同一个存储pool中需配置相同型号和规格的磁盘,若采用不同规格和型号的硬盘,将造成木桶效应,整体性能已最低性能为准。
    • 同时规划ZStack企业分布式存储中需折算为三副本后的有效容量且生产环境必须三副本,禁止使用两副本。
    • 在采购SSD作为缓存盘时必须确保DWPD大于3,避免SSD频繁故障,目前市面常见SSD作为系统盘大小推荐400-600G。
    • 如果采用ZStack Cloud云平台本地存储,在磁盘规划和选型时需折算RAID后的实际有效容量,选择不同的RAID选择对应不同的主存储容量。
    • 规划镜像仓库时同时也需要考虑RAID后的实际有效容量,推荐镜像仓库的容量为2T。
  • RAID卡选型:

    • 生产环境推荐使用具有断电保护的RAID卡,避免异常断电后cache数据丢失。
    • 选购RAID卡时需注意支持的RAID级别,针对主存储和镜像服务器均采用多副本数据保护RAID。
    • 同时推荐RAID相关配置为Write-through,避免当出现断电后缓存数据丢失从而造成系统损坏。
    • 在生产环境中不建议使用板载RAID卡,建议采购独立RAID卡,当在生产环境中使用板载RAID卡时有很大概率在服务器断电后无法正确进入系统。
    • 在生产环境中针对未配置RAID卡机器断电后无法进入系统,若采用本地存储可能造成云主机业务数据丢失。
    • 针对市面部分RAID卡需进行单独配置,避免已知问题:
      • 例如当服务器选择配置Avago SAS3408iMR RAID卡时,需将Support SPCR关闭,否则可能造成系统黑屏
  • HBA卡选型:

    • 生产环境推荐采购独立HBA卡,因HBA卡的重要性针对不同的场景需考虑注意事项,推荐使用双口HBA卡,当使用单口HBA卡时在IO链路切换时出现IO故障。
    • 同时针对部分特殊HBA卡需进行额外的配置:
      • Emulex型号的HBA卡在SCSI-3 Persist reservation时,并对虚拟机进行热迁移时当使用的HBA卡会发生变化,因此可能导致云主机内部的SCSI-3 PR业务失效。
      • Emulex HBA时对应HBA卡的固件默认不允许请求大于512KB的I/O块,若针对特殊环境需进行相关考虑。
    • 目前市面中整体Qlogic的HBA卡兼容性优于Emulex HBA卡,因此在生产环境首推荐采购QLogic相关的HBA卡。

results matching ""

    No results matching ""